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Die Erfindung betrif ft ein Verfahren zur rechnergestutzten Er- 
stellung von Prognosen far operative Systeme, insbesondere fur 
Steuerungsprozesse u. dgl., auf Basis von mehrdimensionalen, ei- 
nen System-, Produkt- und/oder Prozesszustand beschreibenden Da- 
tensatzen unter Anwendung der SOM-Methode, bei der ein geordnetes 
Raster von die Datenverteilung reprasentierenden Knoten bestimmt 
wird. 

Weiters bezieht sich die Erfindung auf ein System zur Erstellung 
von Prognosen fur operative Systeme, insbesondere fur Steue- 
rungsprozesse, auf Basis von mehrdimensionalen, einen System-, 
Produkt- und/oder Prozesszustand beschreibenden Datensatzen, mit 
einer Datenbank zur Speicherung der Datensatze sowie mit einer 
SOM-Einheit zur Bestimmung eines geordneten Rasters von die Da- 
tenverteilung reprasentierenden Knoten. 

Zahlreiche Steuertechniken in operativen Systemen, z.B. bei der 
industriellen Fertigung oder auch bei der Automatisierung von 
MarketingmaSnahmen bis hin zu f inanztechnischen Handelssystemen, 
basieren auf automatischen Einheiten zur Generierung von Progno- 
sen bestimmter Merkmals-, Qualitats- oder Systemparameter . Die 
Genauigkeit und Zuverlassigkeit solcher Prognoseeinheiten ist 
zumeist eine wesentliche Voraussetzung fur das effiziente Funk- 
tionieren der gesamten Steuerung. 

Die Implementierung der Prognosemodelle hiefiir erfolgt haufig auf 
Basis klassischer statistischer Methoden (sog. Multivariate Mo- 
delle) . Die Zusammenhange , die in den zugrunde liegenden Progno- 
semodellen erfasst werden sollten, sind allerdings oft von 
nichtlinearer Natur. Fur diese Prognosemodelle sind die konven- 
tionellen statistischen Methoden einerseits nicht direkt anwend- 
bar und anderseits, als nichtlineare statistische Erweiterungen, 
schwer automatisierbar . 
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Zur Modellierung nichtlinear er Abhangigkeiten wurde daher zum 
Teil auf methodische Ansatze aus dem Bereich der kunstlicheh In- 
telligenz (Genetische Algorithmen, Neuronale Netze, Entschei- 
dungsbaume etc.) zuruckgegrif f en, die eine bessere Ausschopfung 
der Information in nichtlinearen Zusammenhangen versprechen. 
Prognosemodelle, die auf diesen Methoden beruhen, werden jedoch 




in automatisierten Systemen kaum eingesetzt, weil ihre Effizienz 
und Stabilitat bzw. Zuverlassigkeit im Allgemeinen nicht sicher- 
gestellt werden kann. Ein Grund hiefiir liegt im Fehlen statis- 
tisch gesicherter Aussagen iiber die Grenzen der Effizienz und 
Giiltigkeit von Black-box-Modellen, d. h. in Problemen im Zusam- 
menhang mit Overfitting, Generalisierbarkeit , Erklarungskompo- 
nenten usw. 

Die vorliegende Technik beruht nun auf der Anwendung der soge- 
nannten SOM-Methode (SOM - Self-Organizing-Maps - Selbstorgani- 
sierende Karten) . Diese SOM-Methode, die als Basis fur 
nichtlineare Datenreprasentationen Verwendung findet,.ist an sich 
gut bekannt, vergl. T. Kohonen, "Self -Organizing Maps", 3.Auf- 
lage, Springer Verlag Berlin, 2001. Selbstorganisierende Karten 
stellen eine nicht -parametrische Regress ionsmethode dar, durch 
welche Daten beliebiger Dimension in einen Raum niedrigerer Di- 
mension abgebildet werden. Dabei entsteht eine Abstraktion der 
ursprunglichen Daten. 

Das gebrauchlichste Verfahren zur Datenreprasentation bzw. 
auch zur Visualisierung bei der SOM-Methode beruht auf einem 
zwei-dimensionalen hexagonalen Raster von Knoten zur Darstellung 
der SOM. Ausgehend von einer Reihe numerischer multivariater Da- 
tensatze passen sich die Knoten des Rasters wahrend eines Adap- 
tierungsvorganges kontinuierlich der Form der Datenverteilung an. 
Auf grund der Tatsache, dass die Ordnung der Knoten untereinander 
die Nachbarschaft innerhalb der Datenmenge reflektiert, konnen 
Merkmale und Eigenschaf ten der Datenverteilung aus deir entste- • 
henden "Landschaft" direkt abgelesen werden. Die resultierende 
"Karte" stellt eine lokal Topologie-erhaltende Representation der 
ursprunglichen Datenverteilung dar. 

Zur Verdeutlichung der SOM-Methode kann folgendes Beispiel ange- 
ftihrt werden: 

Es finden sich 1000 Personen auf einem FuSballfeld ein, die zu- 
fallig verteilt auf der Spielflache stehen. Es werden nun 10 
Merkmale (z.B. Geschlecht, Alter, K6rpergr6Se, Einkommen usw.) 
definiert> anhand derer sich alle 1000 Personen untereinander 
vergleichen sollen. Sie unterhalten sich und tauschen nun solange 
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ihre Platze, bis jeder von ihnen von Personen umgeben ist, die 
ihm in Bezug auf die definierten Vegleichseigenschaf ten am Shn- 
lichsten sind. Es wird somit eine Situation erreicht, bei der 
jeder der Beteiligten in Bezug auf die Gesamtheit der Merkmale 
seinem unmittelbaren Nachbarn am ahnlichsten ist. 

Damit wird deutlich, wie es moglich ist, trotz der Mehrdimensio- 
nalitat der Daten zu einer zweidimensionalen Darstellung zu kom- 
men. Nun ist es mit dieser Verteilung der Personen auf dem 
Spielfeld moglich, jedes der Merkmale zwei dimensional (z.B. far- 
big codiert) darzustellen. Der Wertebereich der Farben reicht 
dabei von blau (die niedrigste Auspragung des Merkmales) bis rot 

(die hochste Auspragung des Merkmales) . Visualisiert man auf 
diese Weise alle Merkmale, so erhalt man eine farbige Karte, aus > 
der die Verteilung der jeweiligen Merkmale, d.h. Variablen, vi- 
suell erkennbar ist. Dabei ist zu beachten, dass eine Person 

(bzw.. ein Datensatz) unabhangig von dem betrachteten Merkmal ge- 
nau auf der einen Stelle auf dem FuEballplatz zu stehen kommt. 

Zu einer fertigen SOM kann man auch noch weitere Merkmale asso- 
ziieren; dabei werden Merkmale der Datensatze, die bei der Be- 
rechnung der SOM nicht berucksichtigt werden, graf isch genauso 
dargestellt wie Merkmale, die in die SOM eingeflossen sind. Die 
Verteilung der Datensatze innerhalb der SOM andert sich. dabei 
nicht mehr. 

Eine Anwendung von SOM ist in WO 01/80176 A2 beschrieben, wobei 
dort das Ziel verfolgt wird, eine Gesamtdatenmenge in Teildaten- 
mengen zu teilen, um auf diesen dann Prognose-Modelle zu rechnen. 
Dabei geht es aber darum, die Performance der Berechnung durch 
Verteilung der Rechenlast auf mehr ere Computer zu steigern. Die- 
sem Verfahren liegen zwar zum Teil auch SOMs zu Grunde, nicht 
jedoch, um die Prognos equal i tat zu optimieren, sondern (vorder- 
grundig) um durch das verteilte Rechnen und das anschlieSende 
Z usammenf tihren der E inze lmodelle die Bere chn ungszeit zu verktir- 
zen. Die dabei verwendete Prognos erne thode beruht insbesondere auf 
den sog. "Radial Basis Function (RBF) " -Netzwerken, die mit einer 
speziellen SOM-Variante verbunden werden, welche die SOM-Repra- 
sentation entropie-optimiert. 
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Es ist nun Aufgabe der Erfindung, ein Verfahren bzw. ein System 
der eingangs angeftthrten Art vorzusehen, mit dem eine hohe Leis- 
tungsfahigkeit sowie eine Optimierung der Genauigkeit der Prog- 
nosen erzielbar ist, urn so eine hohe Effizienz der darauf 
basierenden Steuerungsanwendung im jeweiligen operativen System 
zu erm6glichen; in der Folge sollen dadurch z.B. in Fertigungs- 
prozessen qualitativ hochwertigere Produkte erhalten werden k6n- 



nen. 



Das erfindungsgemaSe Verfahren der eingangs angefuhrten Art ist 
dadurch gekennzeichnet , dass zur Beriicksichtigung von Nichtli- 
nearitaten in den Daten eine interne Skalierung von Variablen 
aufgrund des nichtlinearen Einflusses jeder Variablen auf die 
Prognosevariable vorgenommen wird, dass den Knoten. zugeordnete 
lokale rezeptive Bereiche ermittelt werden, auf deren Basis lo- 
kale lineare Regressionen berechnet werden, und dass anhand der 
so erhaltenen Menge lokaler Prognosemodelle optimierte Prognose- 
werte fiir die Steuerung des operativen Systems berechnet werden, 
indem fiir jeden neuen Datensatz der jeweils adaguate Knoten be- 
stimmt und das lokale Prognosemodell auf diesen Datensatz ange- 
wandt wird. 

In entsprechender Weise ist das erf indungsgemafie System der ein- 
gangs angegebenen Art dadurch gekennzeichnet, dass der SOM-Ein- 
heit eine Nichtlinearitats-Riickkopplungseinheit zur internen 
Skalierung von Variablen zum Ausgleich ihres nichtlinearen Ein- 
flusses auf die Prognosevariable sowie eine Berechnungseinheit 
fiir die Ermittlung von lokalen linearen Regressionen auf der Ba- 
sis von den Knoten zugeordneten, lokalen rezeptiven Bereichen 
zugeordnet sind, wobei in einer Prediktionseinheit auf der Basis 
der so erhaltenen lokalen Prognosemodelle optimierte Prognose- 
werte berechnet werden, indem fur jeden neuen Datensatz der je- 
weils adaquate Knoten bestimmt und das lokale Prognosemodell auf 
diesen Datensatz angewandt wird. 



GemaS der Erfindung wird somit zunachst der Datenraum in "Mikro- 
cluster" zerlegt, und danach wird ein jeweils moglichst homoge- 
nes, optimales Gebiet urn diese Cluster fiir die Regression 
bestimmt. In alien diesen Gebieten werden anschlieSend unter- 
schiedliche lokale Regressionen berechnet, die dann einzeln fur 



jeden Datensatz, fur den es eine Prognose zu errechhen gilt, an- 
gewandt werden, j<=5 nachdem, in welchem Mikrocluster er zu liegen 
kommt bzw. welchem er angehort. 



Die besondere Leistungsf ahigkeit der vorliegenden Prognosetechnik 
wird demgemaS durch die Anpassung klassischer statistischer Me- 
thoden, wie Regress ions analyse, Hauptkomponentenanalyse, Clus- 
teranalyse, auf die speziellen Gegebenheiten der SOM-Technologie 
erreicht. Mit der lokalen linearen Regression wird die statisti- 
sche Regress ionsanalyse jeweils nur auf einen Teil der Daten an- 
gewandt, wobei dieser Teil durch die SOM bestiramt wird, d.h. 
durch die "Nachbarschaf t" in der SOM-Karte. Innerhalb dieser 
Teilmenge kann ein Regress ionsmodell erstellt werden, das we- 
sentlich spezifischer ist als ein einziges Modell fiber alle Da- 
ten. Insgesamt werden fur ein Prognosemodell viele lokale 
Regress ionsraodelle mit uberlappenden Datenteilmengen erzeugt. Bei 
der Bestimmung eines Prognosewertes wird immer nur das "nachst- 
gelegene" Modell verwendet. 

Die vorliegende Technik kombiniert somit die Fahigkeit der Self- 
Organizing Maps (SOM) zur nichtlinearen Daten-Reprasentation mit 
dem Kalkul der multivariaten Statistik, um die Effizienz der 
Prognosemodelle zu steigern und den Einsatz dif f erenzierter, 
verteilter Prognosemodelle in automat is ier ten Steuerungssystemen 
zu optimieren. Dabei werden die Schwierigkeiten der bekannten 
Losungsvorschlage uberwunden, indem von einem rein methodischen 
Ansatz Abstand genommen wird. Die Funktion integrierter Progno-- 
semodelle - insbesondere ihre automatisierte Anwendung in Steue'- 
rungsprozessen - wird in einzelne Wirkungsbereiche zerlegt, die 
unabhangig gelost und schliefilich neuartig in ein funktionales 
Ganzes geftigt werden. 

Bei der Erf indung wird auch - anders als beim Stand der Tech- 
nik - dem Umstand Rechnung getragen, dass einzelne Variable • einen 
un t e r s ch i edl i chen , nic htlineare n Einfluss auf die Prognosevari- 
able haben konnen; Tim dies en Nichtlinearitaten in den Daten 
Rechnung zu tragen und eine zumindest weitgehende Kompensation 
hieftir vorzusehen, wird auf Basis einer globalen Regression in 
Verbindung mit lokalen Vorhersagemodellen eine Nichtlinearitats- 
analyse durchgef uhr t , wobei Ni cht linear it at smaSe hergeleitet 
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werden, aus denen Skalierungsf aktoren fur eine interne Skalierung 
zwecks Berucksichtigung der gegebenen nichtlinearen Zusammenhange 
ermittelt werden. Nach Durchfuhrung dieser internen Skalierung 
wird die optimierte SOM-Reprasentation erzeugt. 

in diesem Zusammenhang ist es von besonderem Vorteil, wenn fiir 
jede Variable ein MaS fur ihre Ordnung in der SOM sowie ein MaS 
fiir ihren Beitrag zur erklSrten Varianz gebildet wird, wobei aus 
diesen MaBzahlen die internen Skalierungen auf der Basis ermit- 
telt werden, dass die resultierende SOM-ReprSsentation die vor- 
handenen Nicht linear itaten genauer auflSst. 

Bei der Ermittlung der jeweiligen rezeptiven Bereiche (bzw. re- 
zeptiven Radien, die diese Bereich definieren) ist ein gewisser 
Spielraum gegeben, der durch die notwendige Signifikanz einer- 
seits und die erforderliche Stabilitat andererseits begrenzt 
wird. Innerhalb dieser Grenzen kann ein optimaler rezeptiver Be- 
reich gefunden werden, fur den die Varianz der Residuen minimal 
ist. Von Vorteil ist es daher erf indungsgemaS im Besonderen, wenn 
bei der Ermittlung der den Knoten zugeordneten rezeptiven Berei- 
che deren Grofie jeweils so groS gewahlt wird, dass die erklarte 
Varianz der lokalen Regression bei gleichzeitiger Sicherstellung 
der Signifikanz und Stabilitat im Bereich des Knotens maximal 
ist. Dabei ist es insbesondere gunstig, wenn bei der Ermittlung 
der den Knoten zugeordneten rezeptiven Bereiche jeweils der fur 
die Signifikanz der Regression kleinstnotwendige, fur die Maxi- 
mierung der Prognosegenauigkeit grofitmogliche rezeptive Bereich 
gewahlt wird. v 

Als vorteilhaft hat es sich auch erwiesen, wenn die interne Ska- 
lierung iterativ durchgefuhrt wird. 

Es ist erfindungsgemaS weiters von Vorteil, wenn zum zumindest 
teilweisen Ausgleichen etwaiger Korrelationen zwischen Variablen 
die zugefuhrten Daten vorab einer kompensierenden Skalierung un- 
terworfen werden. Auf diese Weise werden far die weitere Verar- 
beitung gut verwendbare Startwerte erhalten. Dabei hat es sich 
als gunstige Vorgangsweise erwiesen, wenn zur kompensierenden 
Skalierung die einzelnen Datensatze reskaliert werden, wobei die 
Werte einer jeweiligen Variablen aller Datensatze standardisiert 



werden, wonach die Daten in den Hauptkomponentenraum transfor- 
miert werden und die kompensierenden Skalierungen fur die ein- 
zelnen Variablen auf der Basis berechnet werden, dass sich das 
DistanzmaS im ursprunglichen Variablenraum vom DistanzmaS im 
Hauptkomponentenraum minimal unterscheidet . Weiters ist es in der 
Folge auch zwecks Verf ahrensvereinfachung vorteilhaft, wenn die 
kompensierende Skalierung mit der die Nichtlinearitaten in den 
Daten berucksichtigenden internen Skalierung multiplikativ zu 
einer kombinierten Variablen-Skalierurig verknupft wird, die einer 
demgemSS modif izierten SOM-Reprasentation zugrunde gelegt wird. 

Fur die jeweilige Prozesssteuerung ist eine spezielle Ausfuh- 
rungsform des erf indungsgemaSen Systems von Vorteil, die dadurch 
gekennzeichnet ist, dass an die Prediktionseinheit mehrere, ein- 
zelnen Prozesszustanden zugeordnete Steuereinheiten anschlieSen, 
die Prozessergebnisse prognostizieren, die bei den aktuellen 
Prozessdaten entstehen wiirden. 

Auch ist es hier gunstig, wenn an die Steuereinjaeiten jeweils 
gesondert zugeordnete Prozesseinheiten zur Herleitung von Steu- 
erparametern auf Basis der prognostizierten Prozessergebnisse und 
der Sollwerte fur den jeweils im operativen System durchzufuh- 
renden Prozess anschlieSen. 

Die Erf indung wird nachfolgend anhand von besonders bevorzugten 
Ausfuhrungsbeispielen, auf die sie jedpch nicht beschrankt sein 
soil, und unter Bezugnahme auf die Zeichnung noch weiter erlau- 4 
tert. Es zeigen: Fig. 1 schematise!!, in einer Art Blockschalt- 
bild, ein System zur Erstellung von Prognosen, wobei insbesondere 
das Zusammenarbeiten der einzelnen Komponenten dieses Predikti- 
ons-Systems veranschaulicht wird; Fig. 2 eine schematische Dar- 
stellung einzelner Systemmodule mehr im Detail; Fig. 3 ein 
Ablaufschema zur Verarischaulichxing der Vorgangsweise beira erf in- 
dxing sgemaSen Ve rfahren; Fig. 4 ein Diagramm zur Veransch au lich ung 
der mittleren Reichweite in Abhangigkeit vom rezeptiven Radius, 
ftir verschiedene Variablen; Fig. 5 schematisch fiir eine Dimension 
einen rezeptiven Bereich ftir eine lokale lineare Regression; die 
Fig. 6 und 7 zwei Diagramme fur das nichtlineare BestimmtheitsmaS 
bzw. den geschatzten Fehler in Abhangigkeit vom rezeptiven Radius 
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zur Ermittiung des optimalen rezeptiven Radius; Fig, 8 schematisch 
eine Darstellung des erf indungsgemafien Systems in einer Anwendung 
bei einer Prozesssteuerung, in einer Art Blockschaltbild; Fig. 9 
in den Teilfiguren 9A, 9B und 9C SOM-Reprasentationen fur ver- 
schiedene Variablen in einem Stahl-Strangguss-Prozess ; Fig. 10 in 
den Teilfiguren 10A, 10B und IOC entsprechende SOM-Karten nach 
Durchlaufen eines zweiten Iterationsschritts; Fig. 11 fur eine der 
Variablen die SOM-Reprasentation nach einem weiteren Iterations- 
schritt, wobei die Datenordnung (Fig.llA), der nichtlineare Ein- 
fluss (Fig.llB) -und die Verteilung der rezeptiven Radien 
(Fig. 11C) gezeigt sind; und Fig. 12 ein Diagramm, das die Anderung 
der Parameter aufgrund der Iterationen veranschaulicht. 

Esist bekannt, dass in der SOM-Darstellung Daten so dargestellt 
werden konnen, dass bestimmte Eigenschaf ten der Datenverteilung 
aus der SOM-Karte unmittelbar gesehen werden konnen. Die SOM- 
Karte enthalt dabei zwecks Visualisierung ein nach vorgegebenen 
Vorschriften geordnetes Raster von Knoten, z.B. in hexagonaler 
Form, wobei die Knoten des Rasters die jeweiligen Mikrocluster 
der Datenverteilung ireprasentieren. Ein Beispiel hieftir ist in 
den nachstehenden noch naher erlauterten Figuren 9, 10 und 11 
veranschaulicht . 

Beim vorliegenden Verfahren werden nun in der SOM-Darstellung 
groSe Datenmengen so verdichtet, dass die nichtlinearen Zusam- 
menhange in der Representation erhalten bleiben. Hierdurch werden 
jene Datensektoren (Mikrocluster) , welche die fur die Modellbil- 
dung relevanten Inf ormationen enthalten, .einzeln und unabhangig 
selektierbar . Die extrem kurzen Zugrif f szeiten auf diese Daten- 
sektoren ermoglichen eine wesentlich dif f erenziertere Untertei- 
lung der Datenbasis land dadurch eine gezielte Nutzung der 
enthaltenen Nichtlinearitaten fur die Modellerstellung. 

Die Verkniipfung des statistischen Kalktils mit geeignet selek- 
tierten Datensektoren gestattet in der Folge die Nutzung der in 
den nichtlinearen Zusammenhangen vorhandenen Inf ormationen bei 
gleichzei tiger Sicherstellung statistischer Qualitats- und Sig-« 
nif ikanzanf order*ungen. Die Selektion der lokalen Datensektoren, . 
also der rezeptiven Bereiche, wird hierbei auf die Gewinnung 
moglichst effizienter Prognosemodelle hin optimiert. 
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Aus der Menge aller optimierten lokalen Regress ionsmodelle kann 
eine Aussage dartiber getroffen werden, inwieweit die zugrunde 
liegende Datenreprasentation geeignet ist, die nichtlinearen Zu- 
sammenhange der Variablen mit der ZielgroSe zu reprasentieren 
(Nichtlinearitatsanalyse) . Hieraus lassen sich in einem iterati- 
ven Schritt die Reprasentationsparameter der SOM-Datenverdichtung 
(d.h. interne Skalierungen) , im Sinne einer verbesserten Auf 16- 
sungskraft fur die Nichtlinearitaten optimieren, was in der Folge 
zu noch genaueren lokalen Prognosemodellen fiihrt. 

Die besondere Art der SOM-Datenreprasentation erlaubt sodann die 
Visual is ierung aller lokalen Modellparameter in einem Bild. Durch 
die simultane Gegenuberstellung qualitatsrelevanter Parameter 
wird die Sicherstellung der Validitat und Effizienz des gesamten 
Prognosemodells erleichtert, beschleunigt und verbessert. 

Das Prognosemodell als Ganzes umfasst die Menge aller lokalen 
Prbgnosemodelle, die als logisch Oder physisch verteilt zu be- 
trachten sind. Im Einsatzmodus des Prognosemodells wird jeder 
neue Datensatz zunachst jenem Mikrocluster zugeordnet, der ihm am 
nachsten liegt. Hierauf wird das lokale Prognosemodell dieses 
Mikrocluster s auf den Datensatz angewandt und das erhaltene 
Prognoseergebnis der - vorzugsweise lokalen - Steuer- oder Ver- 
arbeitungseinheit zugefuhrt. 

Die spezifische SOM-Datenreprasentation bzw. Datenverdichtung 
nimmt eine zentrale Stellung im vorliegenden Verfahren ein. Die 
gemafi der Darstellung in Fig. 1 in einer Datenbank 1 gespeicher- 
ten historischen Prozessdaten dienen zur in einer SOM-Einheit 2 
innerhalb einer Prediktionseinheit 3 durchge fiihrt en SOM-Generie- 
rung in einem ersten Iterationsschritt des Verfahrens. Basierend 
auf dieser SOM werden als Ergebnis einer in einer Einheit 4 
durchgefxihrten Nichtlinearitatsanalyse neu errechnete Skalierun-' 
gen z ur SOM-Einheit 2, d.h. auf die Datenreprasentation, in einem 




zweiten Iterationsschritt rxickgekoppelt . Diese Skalierungen op- 
timieren die SOM-Datenreprasentation im Hinblick auf die optimale 
Berucksichtigung nichtlinearer Zusammenhange in den Daten fur die 
Prediktion xiber den lokalen Da t ens ek tor en, wie nachstehend noch 
naher erlSutert werden wird. 
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Die Erstellung von lokalen linearen Regressionsmodellen erfolgt 
in einer Berechnungseinheit 5. unter der Berucksichtigung eines 
rezeptiven Radius, der fur das jeweilige Regressionsmodell opti- 
mal hinsichtlich der Prognos equal i tat gewahlt wird. Mit Hilfe des 
rezeptiven Radius wird festgelegt, wie viele Datensatze aus der 
Umgebung eines Mikroclusters fur die Regression verwendet werden. 
je groSer der Radius ist, des to mehr Datensatze aus den umlie- 
genden Knoten weren verwendet: Wenn der Radius gegen "unendlich" 
geht, werden alle Datensatze verwendet. Die weiter entfernten 
Knoten haben aufgrund von dabei vorzugsweise verwendeten 
GauS'schen Gewichtungsfunktionen einen geringeren Einfluss. 

Die Gesamtheit aller lokalen linearen Regress ipnsmodelle uber den 
Datensektoren in Kombination mit der SOM stellt das optimierte 
Prognos e-Modell dar. Dieses Gesamtmodell kann mittels einer Vi- 
sualisierungseinheit optisch dargestellt werden, und es kann, wie 
nachstehend anhand der Fig. 8 noch naher eriautert wird, ggf . auf 
einzelne Sub-Steuereinheiten verteilt und dazu benutzt werden, 
. aus aktuellen Prozessdaten fiir die jeweiligen Steuereinheiten 
spezifische Prognosen hinsichtlich der Prozessergebnisse zu er- 
stellen, die dann zur Steuerung dieser Prozesseinheiten verwendet 
werden . 

In Fig. 1 ist hier der Einfachheit halber nur eine allgemeine 
Steuereinheit 7 veranschaulicht, die mit einer allgemeinen Pro- 
zesseinheit 8 in Verbindung steht. Mit einem Pfeil 9 ist die in 
Echtzeit erfolgende Prozessdaten-Ubermittlung - zwecks Anwendung 
auf laufende Prozessdaten - veranschaulicht, und. Pfeil 10 zeigt 
den Strom von Steuerdaten an; mit Pfeilen 11, 12 ist schlieSlich 
die Zufuhrung von laufenden Prozessdaten zu den jeweils vorher- 
gehenden Einheiten veranschaulicht. 

In Fig. 2 ist zur Verdeutlichung das Zusammenwirken der einzelnen 
Systemkomponenten im Detail veranschaulicht. Dabei ist zu erse- 
hen, dass die SOM-Einheit 2, die zur Datenreprasentation und 
-verdichtung vorgesehen ist, uber einen Kern 13 der Prediktions- 
einheit 3 mit den anderen Einheiten, wie insbesondere der Nicht- 
linearitat-Ruckkopplungseinheit 4, in Verbindung steht, von wo 
die Resultate der lokalen Modellierung auf die Datenreprasenta- 
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tion rxickgekoppelt werden, vim sodann in der Berechnungseinheit 5 
die optimierten linearen Regressionsmodelle iiber lokalen Daten- 
sektoren zu erstellen. Die Visualisierungseinheit 6 zeigt dann 
die so erstellte SOM-Karte an und ermoglicht auch eine visuelle 
Kontrolle . 

In Fig. 3 ist der Ablauf der erf indungsgemaSen Technik schematisch 
veranschaulicht, wobei bei Block 14 die Datenarchivierung und 
ZielgroSen-Vorgabe veranschaulicht sind. In einem ersten Schritt 
(s. Block 15 in Fig. 3) erfolgt in an sich herkommlicher Weise auf 
Basis dieser Daten eine Berechnung einer globalen Regression bzw. 
von Residuen, wonach gemaS Block 16 interne Skalierungen fur die 
Gewinnung der SOM-Reprasentation festgelegt werden. 

Im Einzelnen geht jede Daten-basierte Prognose von einer Vertei- 
lung von Rohdaten aus, die aus K Punkten x£ #j (mit k=l...K) be- 
steht, wobei jeder Punkt j Komponenten (mit j=l...L) besitzt. 
Abgestellt wird die Prognose auf eine ZielgroSe y k/ die im All- 
gemeinen nichtlinear von den Punkten x£ #j abhangt und in sta- 
tistischem Sinn eine Zuf allsvariable ist. Die Variablen x!} (der 
Index k wird der Einfachheit halber im Weiteren weggelassen) mit 
der Varianz 



werden bei der vorliegenden Technik zunachst standardisiert und 
dann (gemaS Schritt 16 in Fig. 3) mit neuen Faktoren gemaS fol- 
gender Beziehung skaliert # wobei diese Faktoren interne Skalie- , 
rungen Gj genannt werden: Die im Folgenden verwendeten Variabrlen 
sind somit 



Die Kovarianzmatrix C der skalierten Variablen Xj kann immer 
durch eine orthogonale Matrix Ai q (mit i=l. . -L und g=l. . .Q) dia- 




gonalisiert werden: 



fj : ~~ j^_jiL x kj ' x kj ( , wobei 



C = A-C* 1 * 3 • A T 
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und fur die Eigenwerte E q 

Eq=(C diag )qq 

gilt. 

Die Kovarianzmatrix C kann weiters zerlegt werden als 
C = B-B, mit B iJs ^A iqy lE^A Jq . 

Mittels der Trans format ionsmatrix Ai q werden die Komponenten Xj 
des Datenvektors x in den Hauptkomponentenraum trans formi ert : 

L 

x' q =^A Jq -Xj , , mit q=l...Q... Anzahl der Haupt komponenten . 

GemaS Block 17 in Fig. 3 erfolgt nun eine Berechnung zur SOM-Da- 
tenreprasentation . 

Die Generierung einer SOM erfolgt in an sich bekannter Weise nach 
dem Kohonen-Algorithmus (Teuvo Kohonen, Self -Organizing Maps, 
Springer Verlag 2001) . Die nichtlineare Representation .der Da- 
tenverteilung x k == x k ,j durch eine SOM hangt dabei wesentlich von 
den internen Skalierungen <jj der Variablen Xj .ab. Eine Multipli- 
kation der internen Skalierungen Cj mit frei bestimmbaren Fakto- 
ren 7Cj andert somit die Datenreprasentation, die sich aus den 
neuen Skalierungen ergibt, und zwar gemaS cr^ =cyiZi. 

Die SOl^-Datenreprasentation kann dazu benutzt werden, Teilberei- 
che von Daten zu definieren. Besteht eine SOM aus N Knoten mit 
reprasentierenden Vektoren m x , wobei 1=1... N, so kann eine 
Teilmenge von Daten dadurch ausgewahlt werden, dass sie innerhalb 
eines rezeptiven Radius r urn einen bestimmten Knoten 1 liegt: 

{x kt }: |jc^-m r | = nun und /'e£/ r (0, *,=1...*, 
wobei 

fn 1# = reprSsentierender Vektor des Knoten 1' und 
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U r = {1'}... Umgebung des Knoten 1, wobei gilt: ||l-l'||^r . 

Die einzelnen Variablen x 3 werden in einer gegebenen SOM-Daten- 
reprasentation unterschiedlich gut aufgelost. Die Ordnung der SOM 
in Bezug auf die Variablen xj wird im vorliegenden Verfahxen fur 
einen vorgegebenen, rezeptiven Radius r durch die mittlere 
Reichweite Ad beschrieben: 

A](r)^iP-, mit s)^cr)(K-\) und 
S J 

wobei 

Hi die Anzahl der Datensatze im Knoten 1, 

crf x) die Varianz der Variablen Xj in der lpkalen Datenmenge 
{ x ki } und 

^ ein Gewichtungsfaktor fur den Knoten 1 ist. 

in Fig. 4 ist beispielhaft in einem Diagramm das Quadrat der 
mittleren Reichweite X 2 (r) in Abhangigkeit vom rezeptiven Radius 
r fur verschiedene Variable V,K und T veranschaulicht, wobei hier 
das nachstehend noch naher erlauterte Beispiel eines Stafctl- 
Stranggusses zugrundeliegt, bei dem die Abhangigkeit der Ziel- 
groSe " Zugf estigkeit 11 von den Parametern Strang-Abzugsgeschwin- 
digkeit V, Abzugs tempera tur T und Konzentration K von Chrom in • 
der Legierungszusammensetzung angenommen ist jmd auf Basis von 
V-, T- und K-Daten Vorhersagen betreffend die Stahlqualitat 
(konkret die Zugf estigkeit ) zu treffen sind. 

Fur den - xiber alle Knoten gemittelten - Reichweite-Wert A* 
gilt bei festem rezeptivem Radius r x ersichtlich: 

^ -> 0 ... Vollstandige Ordnung der SOM innerhalb des rezeptiven 
Radius ri hinsichtlich der Variable Xj 



Xi -> 1 ... VollstSndiger Informationsverlust fur lokale Regres- 
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sionen nach der Variablen Xj irmerhalb des rezeptiven 
Radius ri bezuglich globaler Nicht linearity ten in Xj . 

Urn ohne weitere Voraussetzungen eine moglichst ausgewogene SOM 
als Startpunkt fur die nachf olgenden Schritte zu gewinnen, konnen 
die internen Skalierungen vorzugsweise durch eine Methode fest- 
gelegt werden, die geeignet ist, etwaige Korrelationen in der 
Datenverteilung zu kompensieren. 

Diese kompensierenden Faktoren n* owp ftir jede Variable j werden so 
berechnet, dass das DistanzmaS im gegebenen Datenraum dem Dis- 
tanzmaS im standardisierten Hauptkomponentenraum (Mahalanobis- 
Distanz) moglichst nahe kommt. Dies ist erfxillt, wenn: 




Alternativ oder zusatzlich zu diesen Faktoren konnen Startwerte 
fur die Skalierungen auch aus vorhergehenden univariaten Nicht- 
linearitatsanalysen der Residuen verwendet werden. 

Eine Regression aller K Datenpunkte auf die ZielgroSe y wird hier 
als globale Regression (vgl. Schritt 15 in Fig. 3) bezeichnet. Die 
geschatzten Regressionskoef f izienten (3 0 , pj ftir den Schatzer y 
der ZielgroiSe y, mit 

werden auf konventionelle Weise (vgl. z.B. die sog. schrittweise 
Regression-Methode oder die vollstandige Regressions -Methodejr- auf 
Basis der Kovarianzmatrix C berechnet. 

Die Residuen u k der global en Regression ergeben sich zu 
u k =y k -y k . 

Auf Basis einer SOM-Reprasentation kann nun fur jede Teilmenge an 
Datenpunkten { x^fci) } , die irmerhalb eines rezeptiven Radius ri 
um den Knoten 1 liegt, eine lokale Regression auf das Residuum 
u ki berechnet werden, vgl. Schritt 18 in Fig. 3. Falls zwischen 
der ZielgroSe y und den Variablen Xj ein nichtlinearer Zusammen- 
hang besteht, die SOM-ReprSsentation unabhSngig von der Zielgrofie 



y erstellt wurde, und die lokale Regression in Bezug auf die Va- 
riablen Xj signifikant ist, so kann durch sie ein Teil der (glo- 
bal unerklart gebliebenen) Streuung im Residuum u erklart werden. 

Ein vereinf achtes Beispiel fur eine solche lokale lineare Re- 
gression ist in Fig. 5 gezeigt, wo eine Vielzahl von Datenpunkten 
sowie eine - nicht naher bezeichnete - gesamte Regress ionskurve 
gezeigt sind, und wobei ersichtlich ist, dass der rezeptive Ra- 
dius r, der den rezeptiven Bereich fur die Regression definiert, 
zwischen einem Minimum r^n und einem Maximum r^ax festgelegt wer- 
den kann; diese Grenzen r m i n , rmax sind durch die Signifikanz bzw. 
Linearitat des lokalen Modells gegeben. Die lokale Regressions- 
gerade ist mit 18' bezeichnet. 

Das erhaltene lokale Regressions-Modell ist giiltig fur alle Da- 
tensatze, die im rezeptiven Bereich des jeweiligen Knoten 1 lie- 
gen; die beste Prognose-Genauigkeit fur neue Datensatze besteht 
im Allgemeinen im Zentrum des Bereichs, das sind jene H Daten- 
satze, die dem reprasentierenden Vektor m 1 euklidisch am nSchs- 
ten liegen (d.h. jene, die zu dem Knoten 1 "gehdren"). Hiefur 
gilt : 

argmin, 

Die lokalen Regressions-Modelle konnen wiederum auf Basis der 
lokalen Kovarianzmatrizen C (1) 



gebildet werden, woraus gewichtete Mittelwerte, Varianzen und 
Freiheitsgrade resultieren. Der Einfachheit halber wird auf diese 
Detaillierung im Weiteren verzichtet. 



Fur jede Menge gegebener rezeptiver Radien ri zu den Knoten 1, 
mit 1=1... N, konnen nun xiber der SOM-Reprasentation die lokalen 
Regressionen (gemag Schritt 18 in Fig. 3) ermittelt werden. Dabei 
lassen sich die folgenden an sich bekannten Quadratsummen bilden: 




auf die lokalen Residuen berechnet werden: 
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4° ^lL u l = S £1+ K ! mi ** n 9 esainte Quadratsumme des globalen 
*/ =1 Residuums im rezeptiven Bereich; 

1 ^ ... Mittelwert des globalen Residuums inner- 

halb r(l), auch Offset genannt; 

2f/J . _ _-(0\2 • * • Quadratsumme des globalen Residuums re- 

S ' otal :== v lativ zum lokalen Mittelwert; 

2 di _ 2 t/) 2 (o m # m gesamte erklarte Quadratsumme im lokalen 

S M *~~*g h 

Residuum; 

sf } :^^(u k -t^ 0 ) 2 ••• durch die lokale Regression erklSrte 

k * Quadratsumme; 

' 2<'> v 77 2in . . • durch den Offset erklarte Quadratsumme; 

und 

s ** :== S^ M *i ■•' ^e^^tote Quadratsumme, Residuum 

* 2 . Ordnung . 

Fur die erwartungstreuen Schatzer der erklarten Quadrat summen 
gilt (vgl. Kmenta, J. "Elements of Econometrics", 2. Auflage, 
1997, University of Michigan Press, Ann Arbor) : 

2 (/> 2<» 1 

Ji ist die Anzahl der Regressoren fur die jeweilige lokale Re- 
gression mit dem rezeptiven Radius ri urn den Knoten 1. Damit die 
Regression einen Anteil der gesamten Quadratsumme des Residuums 
signifikant erklart, muss ein Overall-Test ftir die an sich be- 
kannte Testgrofie F* wie folgt erfiillt sein: 

Eine vollstandige Menge von lokalen Regressionen uber der SOM- 
Reprasentation auf das Residuum u wird im Folgenden als Gesamt- 



modell (der lokalen Regressionen) bezeichnet. 



Als entscheidende GroSe fur die Erklarungskraf t des Gesamtmodells 
kann das nichtlineare korrigierte BestimmtheitsmaS Rnl angesehen 
werden, das sich aus den Beitragen der gewichteten, geschatzten 
erklarten Varianzen der einzelnen lokalen Regressionen wie folgt 
zusammensetzt : 

Die Aufsummierung der lokalen Beitrage zu einem Gesamtwert er- 
folgt vorzugsweise gewichtet mit der Zahl der Datensatze Hi, die 
dem jeweiligen Knoten 1 zugeordnet sind, z.B. 



Wesentliche Faktoren, von denen die Erklarungskraf t des Gesamt- 
modells abhangt, sind: 

a) die Bestimmung optimaler rezeptiver Radien r'i fur die lokalen 
Regressionen; 

b) die Ermittlung einer SOM-Datenreprasentation, welche die 
nicht linear en Zusammenhange gut auflSst; und 

c) die Verbindung von a) und b) so, dass die Erklarungskraf t des 
Gesamtmodells maximal wird. 

Die Prognosegenauigkeit des Gesamtmodells hangt (fur eine feste, . 
vorgegebene SOM-Datenprasentation) wesentlich von der Wahl der 
rezeptiven Radien ri ab. Gemafi Schritt 19 in Fig. 3 werden daKer 
nunmehr optimale rezeptive Radien n fur alle Knoten 1 ermittelt, 
wodurch dann gemSS Schritt 20 die gewunschten lokalen Prognose- 
modelle fur alle Knoten, fur die optimalen rezeptiven Radien n, 
erhalten werden, 

Die optimalen Werte r op t fur die rez eptiven Radien ri k onnen vor - 
zugsweise dadurch bestimmt werden, dass unter gleichzeitiger Va- 
riation aller rezeptiven Radien n=r der Wert von R^ maximiert 
wird, vgl. auch die Darstellung in Fig. 6, wo das Maximum in einer 
typischen Kurve von (r) beim Radius r opt gezeigt ist. 
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Alterhativ dazu kann ri auch fur jeden Knoten 1 individuell be- 
stimmt werden, indem der geschatzte Fehler a 2 RlTeBt im Bereich einer 
Testmenge urn den Knoten 1 minimiert wird. Diese Alternative 1st 
wieder beispielhaft im schematischen Diagramm von Fig. 7 gezeigt, 
wo bei einem typischen Kurvenverlauf fur a% Vest ein Minimum beim 
Radius r? pt veranschaulicht ist. 

Fur diese Alternative fur die Ermittlung des jeweiligen rezepti- 
ven Radius r° pt muss zuvor eine Testmenge vom Radius r^" urn den 
jeweiligen Knoten 1 bestimmt werden, die groS genug ist, urn den 
Fehler im Bereich des Knotens 1 significant zu schatzen. Dazu 
wird vorzugsweise gefordert, dass auf Basis dieser Menge selbst 
ein lokales, signif ikantes Regressionsmodell auf das Residuum u 
gebildet werden kann und der relative Fehler in der Schatzung der 
erklarten Varianz a fur diese Menge ein vorgegebenes AusmaS nicht 
uberschreitet (sog. Overf itting-Test) . 

Ein erwartungstreuer Schatzer fur den Fehler der Regression im 
Bereich einer (zentralen) Testmenge ist: 



~ 2 



Die so in rf fc gebildeten, lokalen prognosemodelle fuhren zu einer 
besonders gut en Erklarungskraf t des Gesamtmodells . 

Die Erklarungskraf t des Gesamtmodells hangt weiters wesentlich 
davon ab, wie gut in der Datenreprasentation durch die SOM der 
nichtlineare Einfluss aller einzelnen Variablen xj auf die Ziel- 
groSe y (bzw. auf das Residuum u) fur die lokalen Regress ionen 
unterscheidbar wird. Es ist nun somit eine giinstige SOM-Datenre- 
prasentation zu bestimmen. 

Durch die gezielte Variation der internen Skalierungen Oj (vgl. 
auch Schritt 21 in Fig. 3, mit der Iterations-Riickkopplungs- 
schleife 22) kann die Datenreprasentation so beeinflusst werden, 
dass jene Variablen, die grofSe BeitrSge zu leisten, durch die 
SOM starker "geordnet" werden, und ihr nichtlinearer Einfluss auf 
besser berechenbar und somit optimierbar wird. 



Hierzu sollte - 



zumindest naherungsweise - bekannt sein, 
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a) wie die nichtlinear erklarte Varianz, also das nichtlineare 
korrigierte BestimmungsmaS , durch einzelne Variable be- 
stimmt ist, vgl. auch Schritt 23 in Fig. 3; 

b) wie sich die Ordnung der Variablen x 3 in der SOM auf die durch 
die Variablen x 4 erklarbare Varianz auswirkt; vgl. Schritt 23 in 
Fig . 3 ; und 

c) . wie die Ordnung der Variablen x d von den internen Skalierungen 
Ol abhangt (vgl. Schritt 24 in Pig.3). 

Die Zuordnung der erklarten Varianz s* (genauer: der erklarten 
Quadratsumme) einer linearen Regression zu einzelnen Variablen 
erfolgt vorzugsweise durch folgende Zerlegung. Es wird angenom- 
men, dass die erklarte Quadratsumme der Grundgesamtheit 

ist. 

Durch die zerlegung der Kovarianzmatrix C=B 2 (vgl. oben) , kann die 
erklarte Quadratsumme a >\ in eine symmetrische Quadratsumme nach 
Komponenten aufgeteilt werden: 



^=g^:=(^-i)g(Z^r^) 2 =(A:-i).(^ . 



Die Summanden .»£ k6nnen alg kor relations-bereinigte Beitrage 
der variablen x* zur erklarten Varianz s'J bet rachtet werden. Bin 
erwartungstreuer Schatzer fur die Summanden s'^ ist 



<j*<*- l >(E*/fl) - d J'^fZi m±t d6r Defini tion d,:= (B-Q'-B)* 



Wurde die Regression iiber eine Teilmenge der Indizes j=l...j der 
Variablen Xjt j=l... L gebildet, so ist C" 1 jene Matrix, die 
durch Inversion jenes Teilbereichs der Kovarianzmatrix C hervor- 
geht, der den in die Regression aufgenommenen Variablen x Jf 

Jrl: l?^ ts * ri &*j_ .-g^i^l™ NuU ^ 

die den nicht aufgenommenen Variablen entsprechen. 

Auch fur die nicht in die Regression aufgenommenen Variablen gilt 
dann aufgrund der Korrelation mit den aufgenommenen Variablen, 
dass im Allgemeinen s* tj *o . 
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Fiir eine gegebene Menge lokaler Regressionen wird nun der Beitrag 
einer Variable xj zur erklarten Varianz des Gesamtmodells durch 
eine gewichtete Summe bestimmt: 



Def iniert man fiir den positiven Anteil an der erklarten Varianz 
im Gesamtmodell: 



s 



?r sl,>0 



pj 



.» 3. {ft/. 1* S Ij 

[ 0, SO/IS* 



so ergibt sich als Kennzahl fur den relativen Einfluss Ij ("In- 
fluence") der Variablen Xj auf die erklSrte Varianz des Gesamt- 
modells : 



r s pJ 



J ' L 



Das nichtlineare Bestimmtheitsmafi kann mit dem relativen 
Einfluss Ij ebenfalls den einzelnen Variablen Xj zugeordnet war- 
den, und zwar gemaS der Beziehung 

Diese Zerleguiig wird vorzugsweise zur Beschreibung der Beitrage 
einzelner Variablen zum nicht linear en BestimmtheitsmaS eines aus 
einer Menge lokaler Regressionen gebildeten Gesamtmodells heran- 
gezogen. . 

Wie bereits erwahnt und jetzt nachfolgend verdeutliclxt ist die 
erklarbare Varianz von der Ordnung der SOU abhangig. 

Zum Zwecke der einfacheren Beschreibung wird im Weiteren davon 
ausgegangen, dass die Datehverteilung in den Raum der Hauptkom- 
ponenten transf ormiert wurde bzw. dass aquivalent dazu gilt: 



Der verlust an Information durch die mangelnde Ordnung der Da< 
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tenreprasentation der SOM hinsichtlich der Variablen Xj kann 
durch die mittlere Reichweite %i ausgedruckt werden (vgl, oben) . 
Der Zusarmnenhang zwischen dem Verlust an erklarbarer Varianz und 
der Reichweite A,j kann empirisch durch eine Verlustfunktion 
D(X) ) gemaiS fplgender Beziehung approximiert werden: 

Im vorliegenden Verfahren werden jene Variablen Xj, die auf die 
erklarte Varianz der ZielgroSe y bzw. auf das Residuum u einen 
grofien Einfluss haben, starker gewichtet, d.h. mit einem groSeren 
Skalierungsfaktor versehen, so dass die nichtlineare Abhangigkeit 
der Variablen Xj besser beriicksichtigt und somit das nichtlineare 
Bestimmtheitsmafi R^, maximierbar wird. 

Fur die nun folgende Untersuchung der Abhangigkeit der mittleren 
Reichweite von den internen Skalierungen der SOM wird angenommen, 
dass die. internen Skalierungen a q der trans formierten Datenver- 
teilung gemaS der Beziehung 

vorliegen. 

Im Hauptkomponentenraum hangen die Reichweiten in einfachster 
Naherung von a g in einer Form ab, die heuristisch durch folgenden 
funktionalen Zusammenhang angenahert werden kann: 



^(<^ 5 -.-cr e ,/;)«tanh 



off 



const-r r ~S- 



2/v 2 



Dieser Zusammenhang ^q(a q ) ist hinreichend genau, um eine itera- 
tive Maximierung (s. Schleife 22 in Fig. 3) des nichtlinearen Be- 
st immtheitsmaSes durch Variation der internen Skalierungen a q 
zu ermoglichen . 



Die oben erlauterten Schritte zur Bestimmung einer giinstigen Da- 
tenreprasentation werden nun so mit der Optimierung der lokalen 
rezeptiven Bereiche verkniipft, dass die nichtlinear erklarte Va- 
rianz im Residuum maximiert wird, d.h. die Prognosegenauigkeit 
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des Gesamtmodells optimiert wird, wie nunmehr naher erlautert 
wird. 

Zur Vereinf achung wird im Folgenden die Datenverteilung wieder 
als in Hauptkomponenten trans formiert angenommen. Unter der na- 
herungsweisen Voraussetzung, dass im Hauptkomponentenraum die 
Verlustfunktionen d(A^) voneinander unabhangig sind, ergibt sich 
fur den durch die Variable maximal erklarbaren Varianzanteil : 

R^, (Q) = T « . R i 

' q Rnl • 

Bei einer Anderung der internen Skalierungen ov^cr', folgt hie- 
raus eine relative Anderung Xf der erklarten Varianz im Gesamtmo- 
dell, d.h. von R^ , gemaS: 



Durch Variation von o-; kann nun R^ iterativ oder expliziert ma- 
ximiert werden. Vorzugsweise geschieht dies durch parametrische 
Naherung der Bedingung (s. Block 21 in Fig. 3) 

^{a[ f ...<r' Q )^msx., auf Basis der partiellen Ableitungen 

: , (sog. "hill climbing I ) , woraus ein neuer Satz von A q 
und hieraus ein Satz von Skalierungen cr q folgt. Diese haben 
die Form k • 

cr' =a- arctanh ^) 
* " arctanh(^) * 

Diese neuen Skalierungen fuhren zu einer neuen SOM-Reprasentation 
der Daten, welche die Nichtlinearitaten im Zusammenhang y(x q ) 
besser auflost als auf Basis der Skalierungen in der vorherigen 
Iterationsstuf e . 



Durch wiederholte Anwendung der Re-Skalierungen o- q ->o-' q (Schleife 
22 in Fig. 3) erreicht man so eine sukzessive Verbesserung der 
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Datenreprasentation, in welcher die Prognosegenauigkeit des Ge- 
samtmodells durch die Optimierung der rezeptiven Reichweiten ma- 
ximiert wird. 

Die erhaltenen optimierten Prognosemodelle und KenngroSen werden 
bevorzugt auch visualisiert , vgl. Block 25 in Fig. 3, um eine zu- 
satzliche Validierung des Gesamtmodells zu erlauben. 



Gemafi Block 2 6 in Fig. 3 werden die auf diese Weise erhaltenen 
optimierten Prognosemodelle fur alle Knoten in passender Weise 
auf neue Daten (siehe Block 27 in Fig. 3) angewandt, um so eine 
optimierte Prognose (Block 28) zu erzielen. Hierbei wird jeweils 
das lokale Prognosemodell jenes Knotens auf den jeweils rieuen 
Datensatz angewandt, dessen Reprasentant dem Datensatz am nkchs- 
ten liegt (vgl. oben) . 

Nachfolgend wird der vorstehend allgemein beschriebene Ablauf in 
einer konkreten beispielhaf ten Anwendung fur die Steuerung eines 
Stahl-Stranggusses - mit den Variablen (xi bis x 3 ) : Temperatur T 
(Strangschale) , Strangabzugsgeschwindigkeit V und Legierungsbe- 
standteil-Konzentration K (fur Chrom) - n£her erleiutert, wobei 
die ZielgroSe ein bestimmtes Stahlqualitats-MaJS, namlich bei- 
spielhaf t die Zugfestigkeit des Stahls, ist. Dabei wird der 
Stahlproduktionsprozess durch die laufende Prognose der Stahl- 
qualitat (die Zugfestigkeit) optimiert. Anhand der prognosti- 
zierten Qualitat werden die Steuerparameter (in diesem Beispiel 
die Abzugsgeschwindigkeit V) laufend so veraridert, dass die tat- 
sachliche Zugfestigkeit die geforderte Hohe oder Qute erreicht.' 

Zur Vereinfachung wird angenommen, dass bei diesem Verfahren le- 
diglich die drei genannten Steuergr6£en V, K und T des Prozess- 
zustands die Stahlgualitat bestimmen: 

Als historische Daten zur Model 1 erst ellung wurden in diesem Bei- 
spi el 26. 014 Datensatze i m Laufe eines Produktionsprozes ses er- 
hoben. Die einzelnen Variablen mit den Mittelwerten 

V = 0,291 m/s 
K = 2,23% Cr 
T = 540°C 
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warden in der Datenvorverarbeitung jeweils auf einen Mittelwert = 
0 und eine Varianz = 1 standardisiert und in dieser Form weiter 
verarbeitet . 

Die errechneten und optimierten lokalen Regressionsmodelle konnen 
auf einzelne zugehorige, "lokale" Steuereinheiten 30.1...30.n 
aufgeteilt werden, wie im Schema von Fig. 8 gezeigt ist; die Be- 
rechnung der Prognosewerte kann in diesem Fall in den lokalen 
Steuereinheiten 30.1 ... 30. n stattfinden und dient zur Steuerung 
von zugehorigen, angeschlossenen Prozesseinheiten 31. 1-31. n. Es 
ist aber auch moglich, das Gesamtmodell zentral zu verwalten und 
die Prognosewerte fur die lokalen Steuereinheiten 30.1...30.n 
zentral zu berechnen und anschlieSend entsprechend zu verteilen. 

In Fig. 8 ist im Ubrigen weiters bei 32 eine Datenbank fur die 
Prozessdaten veranschaulicht , die in einer Datenkompressions- und 
Reprasentationseinheit 33 fur die SOM-Reprasentation aufbereitet 
werden. Bei 3 ist in Fig. 8 die bereits anhand der Fig.l erlau- 
terte Prediktiqnseinheit veranschaulicht, der die vorstehend er- 
wahnten Steuereinheiten 30.1, 30.2 ... 30. n nachgeordnet sind. An 
letztere schlieSen die Prozesseinheiten 31.1, 31.2 ... 31. n an, 
die schlieSlich zu einer Prozesssystem-Einheit 34 fuhren. 

Die Komponenten 32, 33 konnen als Einrichtung fur die Datenhal- 
tung 35 bezeichnet werden, wogegen die Einheiten 3 und 30.1, 
30. 2... 30. n ein Steuersystem 36 und die Prozesseinheiten 31.1, 
31. 2... 31. n sowie die Prozesssystem-Einheit 34 ein operatives 
System 37 definieren. 

Im Folgenden wird nun das vorliegende Verfahren anhand des ange- 
sprochenen Stahlguss-Beispiels mit den Variablen Konzentration K, 
Geschwindigkeit V und Temperatur T sowie der ZielgroiSe Zugfes- 
tigkeit exemplar isch durchlaufen. Ziel dabei ist, die Zugfestig- 
keit durch optimale Einstellung von V aufgrund einer moglichst 
genauen und selektiven Prognose der Zugf estigkeit zu optimieren. 

In einer ersten Stufe des Verfahrens wurde zunachst eine voll- 
standige, globale Regression der Zugf estigkeit auf alle drei Va- 
riablen K, V und T gebildet. Diese weist ein korrigiertes 



l-C' M) ccc c cj^kco 

- 25 - ^ 



BestimmtheitsmaE von 0,4i4 auf, d.h. es konnen. 41,4% der gesamten 
Streuung durch die globale Regression erklart werden. Daraufhin 
wurde mit Hilfe der internen Skalierungen Oj zur Kompensation von 
Korrelationen eine SOM errechnet, die in einer etwas vereinfach- 
ten Darstellung in Fi,g.9A (fur die Variable V = Strangabzugsge- 
schwin-digkeit) ; Fig.9B (ftir die Variable K = Konzentration von 
Cr) ; und Fig.9C (ftir die Variable T = Strangtemperatur beim Ab- 
ziehen) zu sehen ist. Die Vereinf achung wurde insbesondere auf- 
grund des Verzichts der Machtigkeit einer f arbcodierten 
Wertedarstellung vorgenommen; statt dessen wurde eine fiinfs'tufige 
Schwarz/wei£- Darstellung gewahlt, wobei weiS den niedrigsten Wert 
darstellt, gepunktete Flachen den nachst niedrigen u.s.w., und 
wobei schwarz die Flachenf til lung fiir Bereiche mit den hSchsten 
Werten ist. 

In der Darstellung von Fig. 9 ist insbesondere in Fig.9A (fur die 
Variable V, also die Abzugsgeschwindigkeit) zu erkennen, dass die 
Werte uber den gesamten Bereich relativ stark gestreut sind, d.h. 
maSig gut geordnet sind. 

In den Darstellungen von Fig. 9 (vgl. insbesondere Fig.9A) wurde 
weiters auch zur besseren VerstSndlichkeit einer der Knoten 
- bei 1 - samt rezeptivem Bereich eingezeichnet , wobei in Fig.9A 
auch ein zugehoriger rezeptiver Radius r eingetragen wurde, der 
den (kreisformigen) rezeptiven Bereich definiert. 

Betrachtet man den nichtlinearen Einf luss der einzelnen Variablen 
ftir diese Reprasentation, so ergibt sich, dass der nichtlineare 
Einfluss der Abzugsgeschwindigkeit V im Vergleich zu den anderen 
Variablen am groEten ist. Folgende nichtlineare Einfltisse Ij, mit 
3 = V, K, T, errechnen sich ftir die einzelnen Variablen: 

Iv = 0,687, Ik = 0,210, I T = 0,103 

Als nichtlineare s Bestimmth eits maS der ersten Iteration er- 

gibt sich = 0,238. Dieser Wert bedeutet, dass von der global 
unerklart gebliebenen Varianz noch 23,8% durch nichtlineare (lo- 
kale) Regressionen erklart werden konnen. 




Daraus lei ten sich (s. die vorstehenden Darlegungen) jene inter- 
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nen Skalierungen ab, die die- Nichtlinearitaten und Ordnungsmafie 
dieses iterationsschrittes fur eine verbesserte SOM-Darstellung 
ergeben : 

a'v= 1,634, a' K = 0,711, Cr = 0,543. 

Hit diesen neuen internet! Skalierungen wird nun die SOM-Datenre- 
prasentation der nachsten Iteration parametrisiert , wobei sich 
gegenuber Fig. 9 modif izierte SOM-Darstellungen ergeben, und zwar 
gemaG Fig.lOA fur V, gemafc Fig.lOB fur K und gemaS Fig. 10C fur T. 
Aus diesen neuen SOM-Reprasentationen ist zu erkennen, dass die 
Ordnung innerhalb der Fig.lOA (fur die Abzugsgeschwindigkeit V) 
erhdht wurde, wahrend insbesondere die Ordnung in Fig. 10C (Tem- 
peratur) geringer geworden ist. Dies entspricht der Anforderung, 
Nichtlinearitaten durch die SOM-Reprasentation besser erkennen 
^and in den lokalen Regressionen nutzen zu konnen. 

Mit den jeweiligen Nichtlinearitats- und OrdnungsmaSen sowie dem 
nichtlinearen Bestimmtsheitsmafi errechnen sich sodann die 
internen Skalierungen fiir die nachste Iteration, deren Ergebnis 
in Fig.llA, 11B und lie dargestellt ist. Dabei ist im Einzelnen 
beispielhaft fur die Variable V (Abzugsgeschwindigkeit) in 
Fig.llA deren SOM-Reprasentation gezeigt, in Fig.llB ist der 
standardisierte lokale Regressionskoef f izient & fur die Abzugs- 
geschwindigkeit. auf die zugfestigkeit (=Zielvariab"le) veran- 
schaulicht, und in Fig.HC ist die zugehSrige Verteilung der 
optimalen rezeptiven Radien fur die lokale lineare Regression 
uber der Datengesamtheit dargestellt. 

Wie aus der Darstellung in Fig.llA ersichtlich ist, ist die Ord- 
nung innerhalb der SOM fur die Variable V im letzten Iterations- 
schritt weiter erh6ht worden. 

in Fig. 12 ist die Anderung aller Parameter K, V und T sowie von 
r 2 ^ xiber die drei Iterationsstuf en Nr. 1, 2 und 3 in einem Dia- 
gramm gezeigt. . 

im Einzelnen enthalt Fig. 12 die Darstellung des Verlaufs der 
nichtlinearen Einflusse fur die einzelnen Variablen K, V, T sowie 
des resultierenden Parameters i& uber den Iterationsschritten 1, 
2 und 3. Durch das nichtlineare BestimmtheitsmaS rL kSnnen nach 




dem 3. Schritt auch von den verbliebenen 58,6% der global uner- 
klarten Varianz 34,7% nichtlinear erklart werden, so dass nun. 
insgesamt 61,7% der gesamten Streuung erklart werden konnen. 

Im Produktionsprozess erfolgt der Einsatz des Prognosemodells 
durch die Zuordnung jedes neuen Prozessdatensatzes zu jenem Kno- 
ten, welcher dem jeweiligen Zustands- bzw. Qualitatsbereich des 
Prozesses entspricht. Fur jeden dieser Bereiche gibt es nun ein 
eigenes Prognosemodell, das den Zusammenhang der Einf lussgrofien 
mit dem Zielwert selektiv beschreibt. 

Die Zuordnung erfolgt entsprechend dem geringsten Abstand des 
Datensatzes Xj zum Knoten 1 gemaS 



Das lokale Prognosemodell dieses Knotens wird sodann auf den Da- 
tensatz angewandt und die prognostizierte Zugf estigkeit zur Ein- 
stellung der optimalen Abzugsgeschwindigkeit herangezogen. 

Diese im Vergleich zum Stand der Technik dif f erenzierte Prognose 
erlaubt eine selektivere Vorhersage der Zugf estigkeit in Abhan- 
gigkeit von K, V und T im jeweiligen lokalen Zustandsbereich. 
Durch die Anwendung des Gesamtmodells auf die neuen Daten im 
Rahmen des Produktionsproz esses kommt es so zu einer insgesamten 
Qualitatsverbesseriing des produzierten Stahlproduktes • 

In ahnlicher Weise lasst sich die Erfindung selbstverstandlich ■ 
auf die vers chiedens ten Produktionsproz esse etc. anwenden, ins- 
besondere auch bei Pertigungslinien, ebenso wie auf automatische 
Verteilsysteme und andere operative Systeme. 




Patentanspriiche : 



1. verfahren zur rechnergestutzten Erstellung von Prognosen fur 
operative Systeme, insbesondere fiir Steuerungsprozesse u. dgl . , . 
auf Basis von mehrdimensionalen, einen System-, Produkt- und/oder 
prozesszustand beschreibenden Datensatzen unter Anwendung der 
SOM-Methode, bei der ein geordnetes Raster von die Datenvertei- 
lung reprasentierenden Knoten bestimmt wird, dadurch gekenn- 
zeichnet, dass zur Berucksichtigung von Nichtlinearitaten in den 
Daten eine interne Skalierung von Variablen aufgrund des nicht- 
linearen Einflusses jeder Variablen auf die Prognosevariable 
vorgenommen wird, dass den Knoten zugeordnete lokale rezeptive 
Bereiche ermittelt werden, auf deren Basis lokale lineare Re- 
gressionen berechnet werden, und dass anhand der so erhaltenen 
Menge lokaler Prognosemodelle optimierte Prognosewerte fiir die 
Steuerung des operativen Systems berechnet werden, indem fur je- 
den neuen Datensatz der jeweils adaquate Knoten bestimmt und das 
lokale Prognosemodell auf diesen Datensatz angewandt wird. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet , dass fur 
jede variable ein Ma£ fur ihre Ordnung in der SOM sowie ein Ma£ 
fur ihren Beitrag zur erklarten Varianz gebildet wird, wobei aus 
diesen MaSzahlen die internen Skalierungen auf der Basis ermit- 
telt werden, dass die resultierende SOM-Reprasentation die vor- 
handenen Nichtlinearitaten genauer auflbst. 

3. verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, • 
dass bei der Ermittlung der den Knoten zugeordneten rezeptiven 
Bereiche deren Grofie jeweils so groS gewahlt wird, dass die er- 
klarte Varianz der lokalen Regression bei gleichzeitiger Sicher- 
stellung der Signifikanz und Stabilitat im Bereich des Knotens 
maximal ist. 

4.. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass bei 
der Ermittlung der den Knoten zugeordneten rezeptiven Bereiche 
jeweils der fiir die Signifikanz der Regression kleinstnotwendige, 
fur die Maximierung der Prognosegenauigkeit gr6Stm6gliche rezep- 
tive Bereich gewahlt wird. 



5. Verfahren nacli einem der Anspriiche 1 bis 4, dadurch gekenn- 
zeichnet, dass die interne Skalierung iterativ durchgefuhrt wi 



6. verfahren nach einem der Anspruche 1 bis 5, dadurch gekenn- 
zeichnet, dass zum zumihdest teilweisen Ausgleichen etwaiger 
Korrelationen zwischen Variablen die zugefuhrten Daten vorab ei- 
ner kompensierenden Skalierung unterworfen werden. 

7. verfahren nach Anspruch 6, dadurch gekennzeichnet, dass zur 
kompensierenden Skalierung die einzelnen Datensatze reskaliert 
werden, wobei die Werte einer jeweiligen Variablen aller Daten- 
satze standardisiert werden, wonach die Daten in den Hauptkompo- 
nen.tenraum trans formiert werden und die kompensierenden 
Skalierungen fur die einzelnen Variablen auf der Basis berechnet 
werden, dass sich das DistanzmaS im ursprunglichen Variablenraum 
vom DistanzmaS im standardisierten Hauptkomponentenraum minimal 
unterscheidet . 

8. verfahren nach Anspruch 6 oder 7, dadurch gekennzeichnet , 
dass die kompensierende Skalierung mit der die Nichtlinearitaten 
in den Daten berucksichtigenden internen Skalierung multiplikativ 
zu einer kombinierten variablen-Skalierung verkniipft wird, die 

1 einer TemgemaS uio6±fiz±eyt^s6^^ms^tdi^o^im^Bide gelegt 
wird. 

9. System zur Erstellung von Prognosen fur operative Systeme, 
insbesondere fiir Steuerungsprozesse, auf Basis von mehrdimensio- 
nalen, einen System-, Produkt- und/oder Prozesszustand beschrei- 
benden Datensatzen, mit einer Datenbank zur Speicherung der 
Datensatze sowie mit einer SOM-Einheit zur Bestimmung eines ge- 
ordneten Rasters von die Datenverteilung reprasentierenden Kno- 
ten, dadurch gekennzeichnet, dass der SOM-Einheit eine 
Nichtlinearitats-Riickkopplungseinheit zur internen Skalierung von 
Variablen zum Ausgleich ihres nichtlinearen Einflusses auf die 

-Prognosevariab]^_sowija..£ij^ fur die Ermittlung 

von lokalen linearen Regressionen auf der Basis von den Knoten 
zugeordneten lokalen rezeptiven Bereichen zugeordnet sind, wobei 
in einer Prediktionseinheit auf der Basis der so erhaltenen lo- 
kalen Prognosemodelle optimierte Prognosewerte berechnet werden, 
indem fur jeden neuen Datensatz der jeweils adaquate Knoten be- 
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stimmt und das lokale Prognosemodell auf diesen Datensatz ange- 
wandt wird. 

10. System nach Anspruch 9, dadurch gekennzeichnet , dass an die 
Prediktionseinheit mehrere, einzelnen Prozesszustanden zugeord- 
nete Steuereinheiten anschliefeen, die Prozessergebnisse prognos- 
tizieren, die bei den aktuellen Prozessdaten entstehen wurden. 

11. System nach Anspruch 10 , dadurch gekennzeichnet, dass an die 
Steuereinheiten jeweils gesondert zugeordnete Prozesseinheiten 
zur Herleitung von Steuerparametern auf Basis der prognostizier- 
ten Prozessergebnisse und der Sollwerte fur den jeweils im ope- 
rativen System durchzuftihrenden Prozess anschlieSen. 
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Zusammenf as sung 

Bei der rechnergesttitzten Erstellung von Prognosen fur operative 
Systeme, insbesondere fur Steuerungsprozesse u. dgl., auf Basis 
von mehrdimensionalen, einen System-, Produkt- und/oder Prozess- 
zustand beschreibenden Datensatzen unter Anwendung der SOM-Me- 
thode, bei der ein geordnetes Raster von die Datenverteilung 
reprasentierenden Knoten bestimmt wird, wird zur Berucksichtigung 
von Nichtlinearitaten in den Daten eine interne Skalierung von 
Variablen aufgrund des nichtlinearen Einflusses jeder Variablen 
auf die Prognosevariable vorgenommen, und es werden den Knoten 
zugeordnete lokale rezeptive Bereiche ermittelt, auf deren Basis 
lokale lineare Regressionen berechnet werden; anhand der so er- 
haltenen Menge lokaler Prognosemodelle werden optimierte Progno- 
sewerte fur die Steuerung des operativen Systems berechnet, indem 
fur jeden neuen Datensatz der jeweils adaquate Knoten bestimmt 
und das lokale Prognosemodell auf diesen Datensatz angewandt 
wird. 



(Fig. 3) 
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